5月10日上午|《数据要素安全流通白皮书》项目第十一小组评审工作展开
当前,在数据资产快速发展的背景下,企业数据资产管理涌现了新模式,数据资产管理新技术也层出不穷。为进一步引导企业全面推进数据资产管理工作,华东江苏大数据交易中心、国家工业信息安全发展研究中心、国家金融科技测评中心三方共同发起《数据要素安全流通白皮书》编撰工作。
同时,为了推进《数据要素安全流通白皮书》项目进程、优化白皮书的内容,我们在项目初始阶段就对外征集相关领域的参编单位。截至目前,已收到参编申请表百余份,经过我们专家评审团的初阶段审核,筛选部分企业进行分组,在接下来的一周内,我们根据小组类别分别展开小组评审工作。
在5月10日上午,我们展开了第十一小组的评审工作,在本场评审工作中,有以下专家和嘉宾出席。
一
【交易中心总经理汤寒林致辞】
首先,汤寒林对参加本次活动的嘉宾、同仁及媒体朋友们表示热烈的欢迎,也对一直以来关心、支持交易中心的各界朋友表示衷心的感谢。
他表示,此次《数据要素安全流通白皮书》由华东江苏大数据交易中心、国家工业信息安全发展研究中心、国家金融科技测评中心三方共同发起编写,目前已经得到100多家企业积极参与,白皮书项目编写规格是非常高的,辐射范围广,影响20多万群体。此外,白皮书项目参编单位均是行业翘楚,希望大家能够群策群力,把这次的白皮书做到能够体现行业的高标准,同样,希望本次白皮书可以帮助企业进一步提升品牌影响力、为定制行业标准做出贡献,也希望本次会议能够让大家广交朋友、有所收获。
二
【协办单位介绍】
在本次评审工作会议中,数据宝ChinaDataPay作为《数据要素安全流通白皮书》指定协办单位和编委会核心成员,全程参与白皮书项目,包括本场小组讨论,并提供全程服务支持。
数据宝首席精算师吕定海主要从公司概述、平台介绍、产品介绍和客户案例三个方面介绍数据宝,数据宝是中国领先的国有数据资产代运营服务商,致力于为国有数据资源方提供数据治理智能化、建模加工产品化、场景应用商品化、流通交易合规化等数据要素商品化全生命周期管理服务,是国内少数具备“国资参股、政府监管扶持、市场化运作、大数据资产交易合法经营资质”属性的大数据“国家队”,数据宝的平台优势有三大点:多元、合法、安全。在产品上,主要分享了大交通数据产品-货车信用宝和智慧交通,其中货车信用宝能够进行货车基础档案评估、货车行驶行为评估、货车运力评估、通行费支付行为评估、行使地域评估和货车信用综合评估,智慧交通能够基于交通大数据,对全国高速公路按时段及路段进行窗口化,基于通过的车流量、车均速度、前后门架等来对时段上的路段的负责饱和度进行监测及预警分析。数据宝已服务超过180个应用场景和近万家知名品牌。
三
【第十一小组申请参编单位演讲】
在本次评审工作会议中,各参会企业依次进行公司介绍、案例分享及对白皮书的建议。
星环信息科技(上海)股份有限公司产品研发中心资深专家杨蔚
星环科技致力于打造企业级大数据基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务。
星环科技研发了一站式大数据基础平台TDH、分布式分析型数据库ArgoDB及交易型数据库KunDB、基于容器的智能数据云平台TDC、大数据开发工具TDS、智能分析工具Sophon和超融合大数据一体机TxData Appliance等多个产品系列,是全球首个突破TPC-DS基准测试及官方审计的厂商,并多次被Gartner、IDC等知名IT分析机构列为中国大数据领导者。
杨蔚基于数据要素的重要属性“权属、安全、价值、流通”来分享对数据要素的理解。
(1)数据权属是一个多元性的概念,“权”代表着权利、权益,“属”意味着归属。数据权属确认是进行数据出资、繁荣数据交易市场、开展数据估值、实现数据维权的前提条件。
(2)数据安全是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。数据安全关键技术要以从数据全生命周期管理作为出发点来进行加强,数据生命周期包括集成、存储、治理、建模、分析、挖掘和流通等环节。
(3)数据价值是指在数据的生命周期中,使用者通过分析手段将数据的属性或内容转换成了具有业务目的的信息,进而实现的降本增效数量。
(4)数据流通是指将数据作为流通对象,按照一定规则从供应方传递到需求方的过程。数据流通可以实现数据资产的价值,而且通过数据资源的多方融 合,还能够实现数据价值的增值。
杨蔚还分享了三种主流静态定价策略。
第一种是成本法优势是(1)易于理解:以成本构成为基础(2)操作简单:以成本加权计算为主;劣势是(1)不易区分:数据要素对应由于是生产经营中的衍生产物,没有对应的直接成本,同时间接成本分摊不易;(2)不易估算:数据要素贬值因素不同且不易估算;(3)不体现收益:无法体现数据要素产生的收益。
第二种是收益法优势是(1)衡量实际价值:能有效衡量资产的实际价值。
劣势是(1)操作复杂:数据要素的预期收益与传统资产评估的度量不同,市面上无有效工具;(2)期限不定:数据要素是动态的,导致使用期限也是动态的;(3)估算不准:在使用增量收益法等方法时,无法作出不应用数据资产情景下的收益(无法作出反事实推断)。
第三种是市场法优势是(1)反应市场:能客观反应数 据要素目前的市场情况(2)真实、可靠:参数和修正系数都是客观指标,相对真实、可靠。劣势是(1)场景受限:假设为公开并活跃的交易市场,这与当前各类交易所、交易平台的交易规模小、评率低、收益少的发展现状不一致;(2)多变性:交易或市场不同,估算逻辑要做相应调整和分析,截止2022年初,国内数据交易主要涉及金融、交通通信等行业,但更多的行业、场景和市场方兴未艾。
星环科技围绕“数据安全管理”和“数据安全流通”两个领域构建企业的数据安全与流通全景架构。
杭州安存网络科技有限公司董事长徐敏、副总裁戴智
杭州安存网络科技有限公司是可信电子数据构建者,致力于解决数字世界可信的难题。首创“互联网+电子数据证明”模式,搭建“安存金融级数据保全云”和“区块链电子证据平台”两大核心平台,将虚拟的电子数据有效地转化为电子证据,并结合区块链、人工智能、大数据分析等前沿技术,一键直通司法区块链、公证、仲裁、法院等多司法通道,实现智慧司法一体化解决,助力互联网时代信用体系建设。
此外,分享了安存科技的区块链在金融和司法领的相关案例。
(1)在金融场景,金融机构通过枢纽链实现各业务数据实时上链,并以司法机构的标准要求进行格式化、要素化分类梳理,使线上金融业务电子数据符合司法要求,解决电子数据举证难、认证难的问题。同时,通过枢纽链实现与法院、仲裁、公证等司法机构的链上互通,实现多元化司法处置,提升金融纠纷解决效率,有效降低不良
(2)在司法场景,企业数据与司法机构的链上直通,可采可信,共治共享,并且安存在国内率先实践并建立了司法机关共同商定的技术标准或接口。能够实现①解决电子证据举证难,认定难②批量举证和司法处理、大幅降低成本③多元化司法解决,多重保障。
长沙锐安上谷科技有限公司CEO吴龙、产品经理胡桂元
锐安上谷致力打造数据治理平台产品,将先进的数据治理理念应用于企业的数据资产管理,赋能数据管理、分析洞察和运营增长,提高用户价值,协助企业全面掌控数据资产现状、提升数据质量、保障数据安全合规、持续释放和挖掘数据价值,驱动科学决策。
服务客户以国企事业单位以及大中型企业单位为主,逐渐将会完成航空航天、电力电网、智慧农业、汽车零部件、机械装备、信息通讯、新能源等全工业场景覆盖。
在案例上,分享了关于国家电网、中航和隧道相关案例。
(1)国家电网案例上,业务分析为政务国网安全、数据共享安全威胁来自于内部网络和外部网络。基于内部威胁行为识别,需主动预警,帮助满足安全合规要求,同时提高企业生产力和公信力。项目效果实现有力支撑了公司全场景网络安全防护能力建设及提升工作,对公司网络安全防护体系建设及完善具有深远意义。新数物联网态势感知平台符合国家加强基础信息网络安全保障体系建设的有关政策,满足网络安全建设需求,为国家能源和其他行业的网络安全防护工作起到示范作用。
(2)中航案例上,项目背景为①现有IT基础设施条件下,数据日益增长导致原先的技术架构不能够满足日常的业务需求,从时间检索响应⻆度以及数 据规模、导致的数据安全问题不得不提上日程。②数据的来源主要是发动机传感器产生的数据,这对于飞机运营商以及顾客是重中之重,利用新的技术架构,新的技术提早发现发动机反馈的信息、让我们提前预知和有备无患。项目建设及目标:①大数据信息平台建设,数据模型的设计、解决数据用途与数据响应时效,数据接口的开发等等。②本次涉及到内容主要是建设新的架构基础,为后续的扩展提供基础平台。③整合所有业务,建立统一的数据中心。分析发动机行为数据,通过数据挖掘来降低投入成本,提高投入效果。提供发动机数据报表,用于公司的决策等等。
浩鲸云计算科技股份有限公司AI首席技术专家曾晓锋
浩鲸云计算科技股份有限公司(简称“浩鲸科技”),是一家领先的数字化技术和服务提供商,致力于帮助全球企业客户实现向数字经济的跨越。成立于2003年,由云锋基金、阿里创投、中兴通讯等联合投资,集电信级系统处理能力和互联网基因于一体,近年来,在大数据、云计算和人工智能领域持续发力,先后获得“国家规划布局内重点软件企业”、国家计算机信息系统集成一级资质、全球研发CMMI 5级认证、国家高新技术企业认定等资质。
浩鲸科技凭借其全球领先的数智产品研发及交付能力,迄今已为全球80多个国家和地区的电信运营商、公共服务部门及其他行业客户提供优质的数字化转型解决方案和产品服务。受到行业及客户的高度认可,并多次被CCTV等各级媒体报道。目前已跻身全球电信软件TOP10、中国软件100强、AI中国·最强人工智能公司TOP30、可信云MSP管理服务能力卓越级。
着重介绍了浩鲸科技旗下数据智能技术品牌-鲸智WhaleDI(企业级云原生数字化基础设施),融合浩鲸科技近20年ICT行业和互联网运营经验,以“云原生、数据智能”为核心技术,为企业客户提供全栈数字化基础设施产品技术,形成多模态研发效能、可信云原生和数智产品以及MSP运营服务的数字化持续赋能平台,助力企业数字化创新。
其中鲸智数智平台(WhaleDI Platform)包括数据工厂、运营平台和AI工厂三部分。基于隐私计算和区块链技术将联邦学习打造成多端的数据建模和推理平台,包括联邦资产管理、资源管理、联邦推理、联邦训练和联邦合作五大模块,实现联邦多方对等合作与合规有序的发展。产品的核心功能有多客户端管理,引入智能视图帮助用户理解数据,数据融合引擎助力快捷智能化取数,系统智能提取最佳特征字段,联邦建模和联邦在线推理。最后介绍了在银行业的案例,通过引进外部数据,完善自身风控能力,以达到监管要求的风控自建要求。
第四范式(北京)技术有限公司政府事务总监魏简康凯
第四范式成立于2014年9月,是企业级人工智能领域的行业先驱者与领导者。第四范式提供以平台为中心的人工智能解决方案,并运用核心技术开发了端到端的企业级人工智能产品,致力于解决企业智能化转型中面临的效率、成本、价值问题,提升企业的决策水平。现已广泛应用于金融、零售、制造、能源与电力、电信及医疗保健等领域,在中国所有以平台为中心的决策型企业级AI市场中排名第一。
以金融应用场景为例,第四范式结合技术落地的案例生动切实地介绍了企业在处理信贷风险流程、基于隐私保护的营销、维护金融体系安全等诸多问题的经验。
数据作为数字经济和信息社会的核心资源,被认为是继土地、劳动力、资本、技术之后的又一个重要生产要素,其在企业数字化转型中发挥重要作用,并对国家治理能力、经济运行机制、社会生活方式等产生深刻影响。第四范式将继续秉承企业发展初衷,为机器学习场景落地、为人工智能建设持续不断地注入自己的力量!
人保金融服务有限公司高翔
主要就金融机构数据外采合规问题进行介绍。
高翔表示,近年法律法规的出台实施,倒逼数据行业大变革,导致明文数据盛宴结束,原三方数据市场的传统玩法无以为继,数据倒卖机构背负巨大法律风险,被迫离开赛道。数据市场需求呼唤合规数据源的责任担当,例如部委事业单位、地方政务平台、数交所、央企和地方国企、头部互联网机构等一手数据源,征信持牌机构,用户是金融机构,范围限于信用评估类数据,可以有更多作为,在这个大背景下,隐私计算的春天到来。
接着对金融行业数据场景合规性和二手数据源的合法性问题进行探讨,面对二手数据源问题只有两个出口,首先,一手数据源要有合理的理由采取委托方式委托第三方处理个人信息,双方要约定委托处理的目的、期限、处理方式、个人信息的种类、保护措施以及双方的权利和义务等。其次,第三方不能超出委托范围处理个人信息,未经个人信息处理者(一手数据源)同意,第三方不得转委托他人处理个人信息。因此,无合理、合法授权同意,二手数据源厂商以委托名义广泛对外提供数据服务,不合理,也不合法。
高翔还表示,隐私计算的必要性与价值,有助于保障数据处理过程中各方的数据安全,优化数据应用安全环境和维护相关数据主体的权益,实现一定条件下的匿名化,减轻授权同意的合规隐患。相比较传统加密方式,隐私计算更符合“最小必要”合规要求,有效防止了数据滥用。有助于个人信息处理者讲清楚自身责任,甚至实现免责。
最后总结了隐私行业存在的问题及未来展望,当前隐私行业发展鱼龙混杂,技术水平参差不齐,产品易用性普遍不如预期,技术兼容性形成“新鸿沟”,互联互通任重道远。未来认为隐私产品会重构风控建模流程和技术架构,实施个性化强,不宜作为企业IT基础设施,需要集成多种能力才能实际投入使用,系统和网络安全需要加固,软硬结合是发展方向,硬件一体机迎来大发展。
四
【申请参编单位对《数据要素安全流通白皮书》的编写建议和编写意向】
五
【企业代表与专家交流讨论】
在本次会议的最后,贵州财经大学丁红发教授针对当前存在的基础性问题与各参会企业人员进行交流探讨:
贵州财经大学丁红发教授:(1)数据的资产化定价肯定是一个核心,但数据资产化除了定价、价值评估,对数据资产化这个过程还有哪些关键环节和问题值得关注?(2)星环科技探索了不同的定价模式,那有没有比较科学的数学模型来推动资产的定价?
星环科技杨蔚:(1)交易机制是值得关注的,传统的点对点模式下能介入的不多,双方撮合,那三方、四方、五方之后,各个参与方之间的权益怎么界定,交易过程后的收益怎么分配,这些问题是需要解决的,这也是当前存在的痛点。单靠交易所要流转起来是困难的,因此需要交易机制来解决。(2)星环科技探索的定价模式还是偏理论,如果要把定价模式量化,需要各参与方的配合,需要一定的数据支撑,因此还处摸索阶段。像静态定价方法,它的成本、效益和市场等,这是我们在不同的数据共享方,比如数据集、api还有基于隐私计算,根据双方的具体应用场景来选择应用,比较个性化。
贵州财经大学丁红发教授:电子合同签订完之后,无论是保险理赔还是监督公证,这个过程中,按传统的公证,事实上公证方是能够看到合同的详细具体细节,现在市场有这些需求,电子合同能保存起来,但无论是公证还是在提供证据的时候,可以采用像隐私计算的手段来保证合同核心数据的保密,同时能够完成安全验证或安全认证,以及证据的出示,安存科技这边除了存证,在这方面有哪些探索?
安存科技戴智:我们安存科技旗下的“爱签”是专业级区块链电子合同生态服务商,基于“互联网+电子证明”模式,对电子合同签约方主体、签署意愿、合同文件等全流程数据进行事先摘要存证并通过区块链同步到公证处等司法机构,出证时公证机构链上进行摘要核验,在确保数据安全、隐私的前提下验证电子合同的真实性和完整性。
同时安存还在探索基于区块链和隐私计算的区块链分布式数字身份,应用可验证声明,将信息最小化或者选择性披露给相关机构,即信息披露满足最小化原则和适当性原则,符合《国家数据安全法》、《个人信息保护法》的要求,最大化保护数据安全、隐私。
贵州财经大学丁红发教授:在行业监管、行业统计调查不需要知道合同细节,但需要知道数据的加和以及一些统计特征,这些数据在这方面,安存科技是否有一些应用?
安存科技戴智:安存“互联网+电子证明”模式,事前存证时对数据进行格式化、要素化梳理,在此过程中可以对相关数据进行梳理、标识、脱敏,并可根据监管行业需求,进行要素化数据分析和可视化展现。同时安存的区块链机产品支持基于TEE可信执行环境,可为数据计算、交换提供可信的运行环境,在保护数据安全、隐私的前提下应用于行业监管、行业统计等场景。
贵州财经大学丁红发教授:之前提供的案例,在国网内部数据是共享的,按数据流通领域,大家普遍认可的是要么是原始数据的共享,要么是api共享,要么是计算结果共享,像用安全多方计算或联邦学习把计算结果共享,我们看到,国网这边都已经采用不同形式的数据共享,而且做了身份验证来验证用户身份,想问在大规模访问数据的过程当中,即使想内部合法的用户在不停访问数据,对数据的访问行为特征有什么监测、对访问的数据集有什么安全评估策略?
锐安上谷:(1)数据访问是通过定制化或配置api,这个api只能访问这部分人,这个api不是通用化,而是定制化,某部分访问这部分数据是给他们配置了相应的权限、数字和字段,想访问别的数据是做不到的。(2)通过这个接口去访问这些数据,它是记录了访问频率以及访问地址以及对方是谁,通过这种统一接口或统一流量出口的方式,去控制整个数据的访问。(3)各个数据流通是内网和外网的数据采集,每一个部分的数据流通通过定制化的协议以及策略在网关的监测下汇集到数据中心,然后存储到整个产品里面。主要通过两种策略:专用协议,把整个数据汇集起来。第二个是通过上层的定制化api接口,去控制整个的访问频率,控制整个数据。
贵州财经大学丁红发教授:(1)在数据的价值交换机制和模式有什么实践?(2)怎样看待数据流通使用开源的两个方向?”
浩鲸云科技曾晓锋:我们国内技术路线业内主要有两种,一种可新环境TEE进行安全计算,基于这种方式对数据同态加密,第二种方式联邦学习,数据不出库,保证数据不被泄露。目前看好的是联邦学习这种方式,国内开源处于摸索阶段。
贵州财经大学丁红发教授:在金融数据合规的问题中哪些可以做到白皮书的边界?
人保金融高翔:对白皮书前期输入不够,不是很了解,因此不能回答这个问题,但可以做到在法规解读和金融场景落地过程中技术和合规方案设计方面可以贡献思考和尝试。
01 |
02 |
03 |
04 |精彩回顾 | 天翼电子商务区块链研究院技术总监徐潜作为嘉宾出席《2022数据要素安全流通论坛——联邦学习专场》并发表主题演讲! |